V2EX  ›  英汉词典

Gumbel-Max Trick

定义 Definition

Gumbel-Max 技巧:一种从离散的类别分布(categorical distribution)中采样的方法。做法是对每个类别的打分(如 logits 或对数概率)加上独立的 Gumbel(0,1) 随机噪声,然后取 argmax;得到的类别样本与原本的类别分布一致。常用于机器学习中将“采样”写成更便于计算的形式;其可微近似形式与 Gumbel-Softmax 密切相关。

发音 Pronunciation (IPA)

/ˈɡʌmbəl mæks trɪk/

例句 Examples

We used the Gumbel-Max trick to sample a class from the categorical distribution.
我们使用 Gumbel-Max 技巧从类别分布中采样一个类别。

By adding Gumbel noise to the logits and taking the argmax, the model can draw discrete samples efficiently during training.
通过在 logits 上加入 Gumbel 噪声并取 argmax,模型可以在训练过程中高效地产生离散样本。

词源 Etymology

Gumbel”来自Gumbel 分布,以德国裔美籍统计学家 Emil Julius Gumbel(埃米尔·尤利乌斯·贡贝尔)命名;“Max trick”指这个方法的关键操作是对加噪后的分数取最大值(argmax)。该技巧在概率与统计推断、以及现代深度学习的离散变量处理(如离散潜变量、离散动作采样)中被广泛引用。

相关词 Related Words

文学/著作与文献出现 Works & Literature

  • Categorical Reparameterization with Gumbel-Softmax(Jang, Gu, Poole,2017)
  • The Concrete Distribution: A Continuous Relaxation of Discrete Random Variables(Maddison, Mnih, Teh,2017)
  • A Tutorial on the Gumbel-Max Trick(Eric Jang 等人相关教程/讲义中常见标题与内容)
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1686 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 11ms · UTC 00:49 · PVG 08:49 · LAX 16:49 · JFK 19:49
♥ Do have faith in what you're doing.